2024 年,AI 正處於群雄並起的戰國時代,各大科技公司紛紛推出自家的大型語言模型(LLM),不斷拓展其應用範圍。
在這篇文章中,我們將深入探討幾家主流公司(當前最知名的御三家:OpenAI、Anthropic、Google)的 AI 生態系統,並介紹他們最新推出的模型,如 GPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro,以及一些代表性的開源模型,如 LLaMA 和 Mistral AI。
每個模型在特定領域都有其獨特的優勢與不足。根據你的需求,選擇最具性價比的模型。
另外大模型的發展速度日新月異,可能我發完這篇文章的隔天,就會有一個強大且超級便宜的模型橫空出世。
所以建議隨時追蹤最新的新聞(如果不知道追蹤什麼,可以從 OpenAI、Anthropic、Google 這三大家新聞來關注)。
為了讓大家更容易理解,我根據個人使用經驗,對每個模型進行了評分,並分成六大類別:
請注意,這些評分都是基於個人主觀經驗,歡迎大家分享自己的使用心得。
LLM 通常是基於 token 來計價的。你可以簡單地將 token 理解為單詞,比如 “I like cats” 這句話會被拆分成 “I”, “like”,和 “cats” 三個 token。
較長且不常見的單詞,如 "javascript",可能會占用兩個 token(“java”、“script”)。中文字則可以更簡單地理解為一個字就是一個 token。模型會根據你輸入了多少 token 以及它輸出了多少 token 來計價。
另外,假如你今天傳送了很多歷史對話給 AI,這些文字也會算入輸入 token 的範圍內。
OpenAI 毫無疑問是目前最知名的 AI 公司,比較常被使用的模型有二
GPT-4o
被人稱為現代最強的五條悟模型
強大、快速、聰明,但也昂貴
咱們就把他當作衡量其他模型的戰力單位吧
評分:
GPT-4o Mini
小而強大,且成本低得驚人,適合非專業的常見應用。
評分:
Anthropic 是我認為唯一能與 OpenAI 打得有來有回的公司,我非常看好它的未來發展。
當前主流的模型有三個:
Claude 3.5 Sonnet
對標 GPT-4o
但具備輸入更多 token 的能力。
評分:
Claude 3 Haiku
速度快、聰明且價格親民,不過也算上一代的就模型了,曾經也是高 CP 值的選擇
評分:
Claude 3 Opus
已經過時的產品,不建議使用。
評分:
Google 的 Gemini 系列主打多模態處理,特別是在文本與圖像結合的應用上表現出色。這使得它成為處理需要多種媒體的項目的理想選擇。
Gemini 1.5 Pro
個人使用感覺,在純文本生成和程式碼生成方面,表現不如 GPT-4o 或 Claude 3.5 Sonnet。
而且 Google 對惡意字詞偵測特別奇怪,我之前只是說了臭豆腐三個字
就被認為是惡意對話,整個 API 直接炸掉
回答速度 8 分
程式碼精確度 8 分
中文造詣能力 6 分
通靈能力 7 分
成本
輸入 $3.50 / 1百萬 token
輸出 $10.50 / 1百萬 token
綜合評分 5 分
Gemini 1.5 Flash
Gemini 的輕量版,專為小規模的文本生成和視覺處理設計。
它的處理速度快,並且成本超級低廉,甚至只有 GPT-4o-mini 的一半,非常適合輕量級應用或快速原型設計。
回答速度 9 分
程式碼精確度 6 分
中文造詣能力 6 分
通靈能力 5 分
成本
輸入 $0.075 / 1百萬 token
輸出 $0.3 / 1百萬 token
綜合評分 8 分(耐不住他真的很便宜)
如果今天你要開發的應用極度看重隱私,你完全不希望讓 OpenAI、Antrophic 等其他公司去接手你的資料,那你可以試試看開源模型
你可以在你自己的電腦上運作這些模型(當然,這會對電腦顯卡的要求會很高)
對於需要高控制權的開發者來講
你可以研究看看如
LLaMA 3.1
StableLM
Mistral
Gemini Nano
當然,運行開源模型的學習成本很高,其實對於快速構建一個應用並不友善
而且如果不是隱私問題與成本問題,其實並不是特別好的選擇
所以這將不是我們本教學的重點
我們大致理解了 2024 年九月的現在各種模型的差異與比較
請務必注意, AI 的發展飛速,哪怕幾個月這些排行可能都會大洗牌
隨時保持關注,特別是那御三家 AI 公司的動向
才是開發 AI 應用的上上之策
接下來我們仍會以 gpt-4o-mini 這個模型為教學範例